宋宝华:关于ARM Linux原子操作的实现
竞态无所不在
首先我们要理解竞态(race condition)无所不在,哪怕是对一个全局变量做++的加1动作。
a=0
a++;
a++这句话,会被翻译为多条指令:
ldr r3, [r3, #0]
adds r2, r3, #1
str r2, [r3, #0]
它会先读(ldr),再修改(add),再写(str),是一个典型的读-修改-写(RMW)序列。a++在硬件上不是原子的!
假设2个线程(或者1个线程1个中断)“同时”做a++,因为加了2次,理论上a应该是等于2,但是结果a可能只是等于1,原因很简单:
假设第2个线程,在第一个线程做完读(LDR)之后,抢入率先做完a++,显然这个时候a=1,但是由于第一个线程在ldr指令里面已经读到了a=0,第1个线程在第2个线程做完a++后,继续做++还是会在0的基础上面加(只需要执行add和str指令了),所以导致第1个线程再++后,a还是等于1.
解决这样的race condition,我们需要把2个线程的a++的读-修改-写序列,串行化,彼此排他化。
也就是把这种交错的RMW:
变成这种先后发生的RMW:
这样第2个序列可以读到1,并且在1的基础上加1,保证结果是2。
LDREX和STREX
ARM V7之后的LDREX、STREX指令可以解决这个问题。它保证2个读-修改-写序列有交叉的时候,只有1个可以写成功,另外一个则再次尝试。
比如下面这个序列,R用的LDREX,W用的STREX,则只有第一个线程的STREX可以成功,而第二个的W(STREX)会失败:
类似如下:
那么,这个执行strex失败的线程2,会把第一条的LDREX指令重新执行一次:
STREX指令,除了把寄存器的值写入一个地址以外,还可以返回这次写是否成功。
STREXEQ r0, r1, [LockAddr]
上述指令把r1写入地址LockAddr,如果写入成功,则r0=0,否则r0不等于0。如果r0不等于0,证明写入失败,那么需要重新来ldrex,重新来修改和写。官方解释如下:
The STREX instruction performs a conditionalstore of a word to memory. If the exclusive monitor(s) permit thestore, the operation updates the memory location and returns the value0 in the destination register, indicating that the operation succeeded.If the exclusive monitor(s) do not permit the store, the operationdoes not update the memory location and returns the value 1 in thedestination register. This makes it possible to implement conditionalexecution paths based on the success or failure of the memory operation.For example, STREX R2, R1, [R0] performs a Store-Exclusiveoperation to the address in R0, conditionallystoring the value from R1 and indicating successor failure in R2.
类似如下流程:
当两个LDREX,STREX序列交错的时候,谁先STREX,谁成功,第2个STREX失败,类似:
所以谁先LDREX不是重点,重点是谁先STREX谁成功,后STREX的重新来LDREX。
(完)
"Linux阅码场"是专业的Linux及系统软件技术交流社区,Linux系统人才培养基地,企业和Linux人才的连接枢纽。
查看我们精华技术文章请移步:
求职招聘请移步:
Linux阅码场: 连接企业和Linux人才的platform总线
扫描二维码关注我们
如果觉得好,请
转发
转发
转发